1
算术公平与加权智慧
MATH801B-PEP-CN Lesson 5
00:00
“算术公平” 权均等齐 (1:1:1) 内容 能力 效果 “加权智慧” 各有所重 (5:3:2) 内容 能力 效果
在数据的世界里,并非所有信息生来都具备同等的地位。当我们在处理“例1 演讲比赛”的成绩时,如果直接将内容、能力和效果的分数相加除以3,这就是“算术公平”——每个维度的权都是1,不偏不倚。然而,在真实的竞争和决策中,评委往往更看重某一项能力,此时引入不同大小的“权 (weight)”,便展现出一种精准刻画事实的“加权智慧”

理解“权”与加权平均数

一般地,若 $n$ 个数 $x_1, x_2, \cdots, x_n$ 的权分别是 $w_1, w_2, \cdots, w_n$,则:

$\frac{x_1w_1+x_2w_2+\cdots+x_nw_n}{w_1+w_2+\cdots+w_n}$

叫做这 $n$ 个数的加权平均数 (weighted average)。权 (weight),有表示数据重要程度的意思。权越大,这部分数据对最终平均数的影响力就越强(就像物理天平上更重的砝码会吸引支点靠近它)。

例1 演讲比赛成绩表应用

假设选手A在内容上得分极高,但在舞台效果上稍弱。如果采取“算术平均”,他可能和各项平庸的选手B同分;但如果我们对“内容”赋予0.5的权重,对“效果”赋予0.2的权重,选手A的加权成绩就会因其核心能力的突出而胜出。加权平均数真实地反映了选拔人才时的具体价值取向。

频数作为权:处理成群的数据

在统计大规模数据时,(如“例6 商场服装部”营业员的月销售额,或跳水队运动员的年龄调查),同样的数值会多次出现。此时,出现的次数(频数)就自然成为了该数值的权。

在求 $n$ 个数的平均数时,如果 $x_1$ 出现 $f_1$ 次,$x_2$ 出现 $f_2$ 次,$\cdots$,$x_k$ 出现 $f_k$ 次 (这里 $f_1+f_2+\cdots+f_k=n$),那么这 $n$ 个数的平均数:

$\bar{x} = \frac{x_1f_1+x_2f_2+\cdots+x_kf_k}{n}$

也叫做这 $k$ 个数的加权平均数,其中 $f_1, f_2, \cdots, f_k$ 分别叫做 $x_1, x_2, \cdots, x_k$ 的权。通过这种方式计算出的月销售目标,能过滤掉个别极端高销量的干扰,真实反映大部分营业员的普遍实力,从而制定出既有挑战性又具可行性的奖励制度。

组中值的智慧折中

当数据被粗略地分配到不同区间(数据分组)时,我们失去个体的具体数值。此时,一个小组的组中值是指这个小组的两个端点的数的平均数。例如将区间中点与该区间的频数相乘,就形成了经典的加权计算模式:

$\bar{x} = \frac{11 \times 3 + 31 \times 5 + 51 \times 20 + 71 \times 22 + 91 \times 18 + 111 \times 15}{3+5+20+22+18+15}$

🎯 核心法则:寻找数据的真实重心
无论是人为设定的“重要程度”,还是自然发生的“频数统计”,权的本质都是赋予数据对应的引力。加权平均数不是简单的算术除法,而是帮助我们在复杂数据中找寻到不被极端值轻易欺骗的“真实中心”。